3 research outputs found

    A Possibilistic Query Translation Approach for Cross-Language Information Retrieval

    Get PDF
    International audienceIn this paper, we explore several statistical methods to find solutions to the problem of query translation ambiguity. Indeed, we propose and compare a new possibilistic approach for query translation derived from a probabilistic one, by applying a classical probability-possibility transformation of probability distributions, which introduces a certain tolerance in the selection of word translations. Finally, the best words are selected based on a similarity measure. The experiments are performed on CLEF-2003 French-English CLIR collection, which allowed us to test the effectiveness of the possibilistic approach

    Désambiguïsation des Traductions des Requêtes dans la Recherche d'Information Translinguistique

    No full text
    We have proposed in this thesis four approaches for query translation (QT) disambiguation, in which we try to overcome some problemsof existing approaches in the literature, namely: (i) the problem of translation disambiguation, ( ii) the lack of coverage in bilingual dictionaries, and (iii) the lack of context provided by the source queries terms. The first three approaches are based on the measures of possibilities and the probability-to-possibility transformation. Whereas, the fourth approach is based on bilingual proximity. Our contributions are summarized as follows:Firstly, we have proposed and tested a query translation approach based on probability-to-possibility transformation.This approach is based on a bilingual French-English dictionary. We start by enriching the dictionary by automatically generating words and their translations from a parallel corpus. The obtained dictionary was checked and enriched via an online intelligent proofreader. In addition, we have considered contextual information in the source query to guarantee relevant documents. Then, we have identified, from the source query, the name phrases (NPs) in order to translate them into units using translation patterns and a language model (trigram). Source query terms that are not part of the selected noun phrases are translated word-by-word using a possibilistic approach for single words translation.Secondly, we have investigated a discriminative possibilistic approach for QT disambiguation. In this approach, the translation relevance of a term is modeled by two measures: possible relevance and necessary relevance. Possible relevance rejects irrelevant translations, while necessary relevance strengthens translations that are not eliminated by the possibility.Thirdly, a hybrid possibilistic approach of QT disambiguation was proposed and tested. This approach is a combination of the first two methods. We have taken advantage of the strengths of the first approach based on probability-to-possibility transformation in the translation of noun phrases and the strengths of the discriminative possibilistic approach in the translation of the remaining terms of the query.Fourthly, a proximity-based disambiguation approach was suggested and assessed. In this approach, we have combined a bilingual French-English dictionary with a parallel French-English corpus (Europarl), to build a bilingual semantic dictionary of contexts (BSDC).This new linguistic resource ensures automatic learning of source queries. This approach is based on stochastic methods, where the query terms and their translations are represented as bilingual semantic graph. This graph is transformed into Markov chains, where the states are the nodes of the graph and the transitions are its edges. We used the PROX method which calculates a semantic similarity score (proximity) between the ambiguous terms of the source query in order to identify the suitable translation of each source query term. Finally, we have designed and implemented a Cross-Language Information Retrieval (CLIR) tool, denoted SPORT in order to evaluate our contributions. We have implemented the SPORT interfaces using Java language and we have integrated the Terrier platform, which provides indexing and matching models. We have assessed the results using the OKAPI BM25 matching model and the CLEF-2003 test collection.Nous avons proposé dans cette thèse quatre approches de désambiguïsation des traductions des requêtes (TR), dans lesquelles nous avons essayé de franchir les difficultés retrouvées dans les approches existantes dans la littérature, à savoir : (i) le problème de la désambiguïsation des traductions, (ii) le manque de couverture des dictionnaires bilingues, et (iii) le manque de contexte fourni par les termes des requêtes sources. Les trois premières approches sont basées principalement sur les mesures des possibilités ainsi que la transformation probabilité-possibilité. Alors que, la quatrième approche est à base de proximité bilingue. Nos contributions sont résumées comme suite:Premièrement, nous avons proposé une approche possibiliste de TR à base d’un dictionnaire bilingue Français-Anglais. Tout d’abord, nous avons enrichi la couverture du dictionnaire en générant les mots ainsi que leurs traductions automatiquement à partir d'un corpus parallèle. Le dictionnaire obtenu a été vérifié et enrichi via des correcteurs intelligents en ligne. En outre, nous avons gardé le maximum d’informations contextuelles existantes dans les requêtes sources pour garantir des documents pertinents. Puis, nous avons identifié, à partir de la requête source, les syntagmes nominaux afin de les traduire en unités en utilisant des patrons de traduction et un modèle de langue (trigramme).Les termes de requête source qui ne font pas partie des syntagmes nominaux sélectionnés sont traduits mot-à-mot en utilisant une approche possibiliste de traduction des mots simples.Deuxièmement, nous avons proposé et testé une approche possibiliste discriminative de désambiguïsation de TR. Dans cette approche, la pertinence des traductions d'un terme est modélisée par deux mesures, à savoir: la pertinence possible et la pertinence nécessaire. La pertinence possible permet de rejeter les traductions non-pertinentes, alors que la pertinence nécessaire permet de renforcer les traductions non-éliminées par la possibilité.Troisièmement, nous avons proposé et évalué une approche possibiliste hybride de TR. Cette approche présente une combinaison des deux premières méthodes. Nous avons profité des points forts de l’approche à base de transformation probabilité-possibilité dans la traduction des syntagmes nominaux ainsi que les points forts de l’approche possibiliste discriminative dans la traduction des termes restants de la requête.Quatrièmement, une approche de désambiguïsation de TR à base de proximité a été proposé et discuté. Dans cette approche nous avons combiné un dictionnaire bilingue Français-Anglais avec un corpus parallèle Français-Anglais (Europarl), pour construire un dictionnaire sémantique bilingue de contexte (DSBC). Cette nouvelle ressource linguistique assure un apprentissage automatique des requêtes source. Cette approche est basée sur des méthodes stochastiques, où les termes des requêtes ainsi que leurs traductions sont représentés sous forme des graphes sémantiques bilingues. Ce grapheest transformé en des chaînes de Markov, où les états sont les nœuds du graphe et les transitions sont ses arêtes. Nous avons utilisé le principe de PROX qui calcule un score de similarité sémantique (proximité) entre les termes polysémiques des requêtes sources afin d’identifier la traduction appropriée de chaque terme de la requête source.Finalement, nous avons conçu et implémenté un outil de recherche d’information translinguistique, dénommé SPORT (Système POssibiliste de tRaduction de requêTes) afin d’évaluer nos contributions. Nous avons implémenté les interfaces de cetoutil en langage Java et nous avons intégré la plateforme Terrier qui fournit des modèles d’indexation et d'appariement. Dans notre cas, nous avons évalué les résultats en utilisant le modèle d’appariement OKAPI BM25 ainsi que la collection de test CLEF-2003

    Differentiation of Fanconi anemia and aplastic anemia using mitomycin C test in Tunisia

    No full text
    International audienceFanconi anemia (FA) is a recessive chromosomal instability syndrome that is clinically characterized by multiple symptoms. Chromosome breakage hypersensitivity to alkylating agents is the gold standard test for FA diagnosis. In this study, we provide a detailed laboratory protocol for accurate assessment of FA diagnosis based on mitomycin C (MMC) test. Induced chromosomal breakage study was successful in 171 out of 205 aplastic anemia (AA) patients. According to the sensitivity of MMC at 50 ng/ml, 38 patients (22.22%) were diagnosed as affected and 132 patients (77.17%) as unaffected. Somatic mosaicism was suspected in an 11-year-old patient with a FA phenotype. Twenty-six siblings of FA patients were also evaluated and five of them (19.23%) were diagnosed as FA. From this study, a standard protocol for diagnosis of FA was developed. It is routinely used as a diagnostic test of FA in Tunisia
    corecore